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异 构 环境 下 的 多 子 阵 合成 孔径 声 纳 距 离 多 普 勒 成 像 算 法 
钟 何平 ， 唐 劲松 ， 黄 梦 


(海军 工程 大 学 海军 水 声 技术 研究 所 , 武汉 430033) 


摘 要 :为 解决 多 子 阵 合成 孔径 声 纳 成 像 效 率 低 的 问题 ,提出 了 一 种 异 构 环 境 下 的 多 子 阵 合成 孔径 声 纳 快速 成 像 方法 。 
根据 多 子 阵 合 成 孔径 声 纳 距离 多 普 勒 成 像 算法 特点 以 及 CPU 和 GPU 各 自 计 算 特 点 ， 通 过 将 算法 中 距离 向 脉冲 压缩 、 
固定 相位 补偿 、 距 离 徙 动 校正 和 方位 向 脉冲 压缩 密集 型 运算 采用 GPU 计算 ， 极 大 提高 了 多 子 阵 合成 孔径 声 纳 成 像 效 
率 。 最 后 通过 实测 数据 的 成 像 实 验 对 所 提 算 法 的 正确 性 和 高 效 性 进行 了 验证 ， 与 串 行 计算 方法 相 比 加 速 比 高 达 14.45。 
关键 词 : 合成 孔径 声 纳 ; 距离 多 普 勒 成 像 ; 并 行 计算 ; 图 形 处 理 器 
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Range doppler algorithm for multi-array synthetic aperture sonar 
in heterogeneous environment 


Zhong Heping, Tang Jinsong, Huang Pan 
(Naval Institute of Underwater Acoustic Technology, Naval University of Engineering, Wuhan 430033, China) 


Abstract: Aiming to solving the low efficiency imaging of multi-array synthetic aperture sonat, a fast imaging method for multi- 
array synthetic aperture sonar in heterogeneous environment is proposed. Considered the range Doppler algorithm characteristic 
for multi-array synthetic aperture sonar and different calculation features between CPU and GPU, the intensive calculation such 
as range compression, phase compensation, range cell migration compensation and azimuth compression is implemented on 
GPU, which greatly enhances the imaging efficiency for multi-array synthetic aperture sonar. In the end, the validity and 
efficiency of the proposed method are verified through the imaging experiment performed on real data and the speedup is up to 
14.45 times compared to the serial algorithm. 
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加 大 以 满足 高 速 测绘 需求 ， 这 两 个 因素 的 共同 作用 导致 了 原始 
数据 距离 向 点 数 的 不 断 增加 。 测 绘 带宽 度 增 加 的 同时 ， 最 大 疯 
合成 孔径 声 纳 (synthetic aperture sonar SAS) 是 一 种 高 分 辨 绘 距离 不 断 加 大 导致 了 合成 孔径 长 度 的 增加 ， 原 始 数据 方位 向 
率 成 像 声 纳 ， 其 原理 是 利用 小 尺寸 的 声 基 阵 沿 空间 作 和 匀速 直线 点 数 也 在 不 断 增加 。 原 始 数据 量 的 增加 将 显著 延长 合成 孔径 成 
运动 来 合成 大 的 虚拟 孔径 ， 并 在 运动 过 程 中 以 恒定 的 脉冲 重复 像 所 需要 的 时 间 ， 导 致 成 像 效 率 降 低 ， 难 以 满足 合成 孔径 声 纳 
间隔 发 射 和 接收 信号 ， 根 据 空间 位 置 和 相对 关系 将 不 同位 置 的 系统 实时 性 需求 。 合 成 孔径 成 像 在 硬件 选择 上 主要 有 专用 硬件 
可 波 信号 进行 相干 琶 加 ， 进 而 获得 方位 向 上 的 高 分 辩 率 0 。 距 方案 [和 通用 硬件 方案 &12 两 种 。 在 合成 孔径 声 纳 发 展 早期 , 因 
离 向 上 的 高 分 辩 率 通过 发 射 大 带宽 信号 ， 然 后 通过 脉冲 压缩 技 通用 计算 机 性 能 难以 满足 合成 孔径 声 纳 信号 处 理 需 求 ， 一 般 采 
术 得 到 。 正 是 由 于 合成 孔径 声 纳 具备 高 分 辨 率 特性 ， 近 年 来 在 用 专用 硬件 方案 ， 但 存在 研发 周期 长 、 成 本 高 和 难以 拓展 等 
军用 和 民用 众多 领域 得 到 应 用 59。 和 军用 方面 ,合成 孔径 声 纳 主 点 。 随 着 计算 机 技术 的 发 展 ， 研 究 人 员 通 过 构建 计算 机 集群 的 
要 应 用 于 沉 底 雷 /掩埋 雷 探 测 、 未 爆破 物探 测 、 重 要 海域 的 高 分 方法 来 提升 计算 能 力 ， 实 现 了 合成 孔径 雷达 和 合成 孔径 声 纳 成 
辨 侦察 等 ,民用 方面 主要 应 用 于 水 下 地 形 测绘 ,海底 地 质 勘探 、 像 算 法 的 并 行 ,取得 了 显著 效率 提升 ,集群 计算 机 存在 体积 大 、 
考古 搜救 、 海 底 电 缆 或 石油 管道 的 铺设 和 定位 、 航 道 疏 滩 工 程 功 耗 大 ， 并 且 不 满足 合成 孔径 声 纳 对 信和 号 处 理 平 台 可 移动 的 需 
量 评估 等 方面 。 求 。 图 形 处 理 器 (Graphic Processing Unit GPU) 的 出 现 为 合成 孔 
随 着 合成 孔径 声 纳 技术 的 不 断 发 展 ， 一 方面 成 像 分 辩 率 仍 径 声 纳 信 号 处 理 提 供 了 新 的 处 理 平 台 ， 它 具有 强大 信号 处 理 能 
在 不 断 提 高 以 满足 小 目标 探测 需要 ， 另 一 方面 测绘 带宽 度 不 断 力 和 高 性 价 比特 点 ， 并 且 已 得 到 广泛 应 用 023。 
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Chi 
录用 稿 钟 何平 ， 等 : 异 构 环境 下 的 多 子 阵 合成 
本 文 提出 了 一 种 基于 GPU 异 构 环境 下 的 多 子 阵 合成 孔径 。 ”常用 方法 就 是 将 多 子 阵 回 
声 纳 距 离 多 普 勒 成 像 方法 ， 有 效 解 决 了 合成 孔径 声 纳 系统 的 实 。 调用 单 阵 距离 多 普 勒 成 像 算 法 。 


时 成 像 问题 ， 并 且 为 多 子 阵 合成 孔径 声 纳 异 构 环 境 下 的 软件 开 
发 提供 了 基本 框架 。 首 先 给 出 了 合成 孔径 声 纳 距离 多 普 勒 成 像 
算法 的 基本 原理 ， 分 析 了 各 步 又 信号 处 理 特 点 ， 然 后 针对 距离 


示 传 立 叶 变 换 和 傅立叶 


:hinaXiy 合 作 期 刊 


声 纳 距 离 多 普 勒 成 像 算 法 


波 信号 转换 为 单子 阵 回 波 信号 ， 然 后 


2 给 出 了 RD 算法 的 流程 图 ， 图 中 FFT 和 IFFT 分 别 表 


逆 变 换 。 从 图 


距离 向 处 


E 和 方位 向 处 理 


是 分 了 


向 脉冲 压缩 、 固 定 相 位 补偿 、 距 离 徙 动 校正 、 方 位 向 脉冲 压缩 
在 GPU 环境 下 的 运行 进行 了 并 行 化 设计 。 最 后 通过 实测 数据 
的 合成 孔径 声 纳 成 像 实验 ， 验 证 了 所 提 算 法 的 性 能 。 


1 ， 多 子 阵 SAS 成像 模型 


R, 发 射 路 径 
及 ,实际 接收 路 径 
和 “全 接收 子 隆 尺 , 停 走 停 近 似 时 的 接收 路 径 


平台 运 | yy 
动 方向 9 ““ 及 ,等 效 相位 中 心 近似 后 发 收 路 径 


图 1 


多 子 阵 SAS 成 像 模 型 


图 1 


直角 坐标 系 中 ，SAS 平 
坐标 (r,0) 处 , 发 射 阵 和 N 个 接 


F 台 沿 着 方位 向 运动 ， 目 标 位 于 
改 子 阵 治 方位 向 排列 , 发 射 阵 位 


于 尾 端 , 其 位 置 为 (0.vn) 。 为 简化 处 理 ， 本文 仅 考虑 一 个 接收 子 
阵 ( 取 第 ;个 接收 子 阵 ) 的 情况 , 此 接收 子 阵 与 发 射 阵 方位 向 等 效 
相位 中 心间 隔 为 An ， 假 设 信号 传播 期 间 平 台 移 动 距离 为 wr ， 
其 中 变量 /表示 平台 运行 时 间 ， 第 ;个 接收 子 阵 接收 到 的 回 波 
信号 可 表示 为 
SS,(T,1;7) = A,- re Sf 一 和 2 ‘0@, (7) 
onl -RD 2]| 
c 
op- ;27 LR | (1) 
其 中 yecrz(,) 是 矩形 窗 函 数 ， 定义 如 下 : 
|x|<0.5 
rect(x) = (2) 
0， |x|>0.5 


其 中 去 程 为 : 


R(47)=R+R 为 信号 实际 传播 路 径 ， 


程 为 R=VGtAh+tvi)y +r ， 
s(7)=rect(zt/T) 为 发 射 信号 包 络 ，c 为 声速 ， 为 信号 中 心 频 
率 ， 为 信号 调频 斜率 。 


R=Vv) +r ， 叫 


2 ”多 子 阵 SAS 距离 多 普 勒 成 像 算法 


距离 多 普 勒 成 像 算 法 是 一 类 经 典 的 合成 孔径 成 像 算 法 ， 其 
革 本 思想 是 利用 距离 相同 而 方位 不 同 的 散射 点 在 距离 多 普 勒 域 
具有 相同 的 能 量 轨迹 ， 通 过 插值 解 二 维 耦 合 ， 将 二 维 成 像 处 理 


击 


Ff 进行 的 。 当 回 波 


2 中 可 以 看 出 RD 算法 的 
证 号 在 距离 向 


和 方位 向 不 能 解 而 和 时 ， 需 要 利用 sinc 插值 实现 距离 向 徙 动 校 


正 以 完成 解 看。 


原始 回 波 
数据 
+ 
原始 数据 预 处 理 方位 向 FET \ 
€ s y 
距 距离 向 FFT 距离 向 徙 动 校正 方 
离 位 
脉 | 距离 | 
冲 | 向 参 由 KRC 
距离 向 IFFT 
轩 vy yy 要 
定 相位 补偿 SAS 图 像 
图 2 距离 多 普 勒 算法 流程 图 
从 信号 处 理 流程 上 看 ， 采 用 距离 多 普 勒 算法 进行 合成 孔径 
声 纳 成 像 主 要 包括 原始 数据 预 处 理 、 距 离 脉 冲压 缩 、 固 定 相 位 
补偿 和 方位 脉冲 压缩 4 个 步 又。 原始 数据 预 处 理 主要 包括 有 痪 
数据 截取 、 数 据 类 型 转换 和 子 阵 数 据 亚 加 ， 其 中 原始 数据 有 效 
截取 主要 是 根据 脉冲 重复 间隔 pRy、 平 台 速 度 y 、 子 阵 长 度 pp 
之 间 的 关系 PRI.V = D.M /2 确定 用 于 成 像 的 有 效 子 阵 个 数 
M， 然 后 对 原始 数据 进行 有 效 截 取 。 由 于 原始 数据 预 处 理 步 又 


计算 量 小 ， 


直接 采 


用 CPU 完成 。 距 离 向 脉冲 压缩 ， 主 要 包括 


FFT、 点 乘 和 IFFT 


运算 ， 所 有 计算 者 


是 在 距离 向 上 进行 处 理 ， 


不 同 距离 向 
子 阵 接收 的 信号 转换 为 单子 阵 
算法 进行 处 理 。 
徙 动 校 了 


上 的 处 理 


过 程 完 全 独立 。 
接收 的 


固定 相位 补偿 主要 是 将 多 
言 号 ， 然 后 调用 单 阵 成 像 


方位 向 脉冲 压缩 主要 


包括 FFT、IFFT、 距 离 向 


E 和 点 乘 运算 ， 其 中 距离 向 徙 动 校正 过 程 是 一 个 逐 点 插 


值 过 程 ， 严 重 影响 合成 孔径 声 纳 系统 成 像 效 率 。 
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GPU 环境 下 并 行 算法 


为 解决 合成 孔径 声 引 


其 中 耗 时 处 理 步 又 : 


脉冲 


距离 多 普 勒 成 


像 算 法 实时 性 问题 ， 对 


距离 向 脉冲 


3.1 


这 一 


距离 向 脉冲 压缩 


距离 向 脉冲 压缩 首先 
FFT 变换 ， 由 于 每 一 距离 


步 可 以 


转换 为 两 个 一 维 处 理 的 级 联 形式 。 多 子 阵 合 成 孔径 声 纳 成 像 最 


直接 通 
cufftExecC2C 实现 。 在 调用 


过 调用 CUDA 


压缩 、 
压缩 处 理 计算 方法 进行 了 重新 设计 ， 


时 条件， 提升 算法 计算 效率 。 


固定 相位 补偿 和 方位 向 
以 满足 GPU 并 行 处 


是 对 每 一 距离 向 采样 回 波 数据 进行 
向 回 波 数据 在 内 存 中 连续 存放 ， 


中 高 效 FFT 变换 函 


洋 长 


cufftExecC2C 执行 FFT 变换 前 , 首 


先 需 要 通过 cufftPlan1d 函数 来 构造 FFT 变换 句柄 ， 指 定 FFT 
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录用 稿 


变换 数据 类 型 、 
数 〈 方 位 向 点 数 
入 参数 预先 配 
最 佳 性 能 。 


1 次 连续 变换 点 数 〈 距 离 向 点 数 )、 连 续 变换 次 


) 和 变换 类 型 。 
好 内 存 和 计算 资源 ， 使 和 


变换 句柄 的 好 处 在 于 可 根据 输 


和 运算 时 处 


里 器 能 达到 


距离 向 完成 FFT 变换 后 ， 数 据 在 距离 向 变 为 频 域 ， 


然后 与 距离 向 参考 函数 妃 ( 站 =exp(z 户 /天 ) 相 乘 ， 其 中 上 表 
为 信号 调频 斜率 。 距 离 向 参考 函数 从 本 质 来 


像 之 前 首先 计算 后 存放 在 共享 存储 器 ， 


示 距 离 向 频率 ， 

说 是 一 个 1 维 数组 ,在 成 

其 点 数 与 距离 向 点 数 相同 。 

对 应 相 乘 ， 同 一 距离 位 置 所 乘 数据 相同 ， 
读 取 时 间 开 销 ， 

程 块 划分 ,如 图 3 所 示 。 假设 当 


线程 个 数 为 TN， 
*TN-1 距离 向 数 
次 完成 该 距离 向 


次 调用 


于 参考 函数 是 与 每 一 距离 向 数据 


为 减 小 参考 函数 重复 


在 进行 线程 块 划分 时 ， 按 照 距离 向 进行 1 维 线 
前 线程 块 索引 为 BN,， 其 
则 该 线程 块 完成 列 数 为 BN*TN 至 (BN+1) 


包含 的 


据点 乘 ， 线 程 块 中 每 一 


线程 按照 方位 向 顺序 依 


上 所 有 数据 的 点 乘 运算 。 


完成 点 成 运算 后 ， 再 


FFT 逆 变换 函数 ,完成 距离 向 脉冲 ) 


变换 句柄 与 正 变 
变 变换 类 


换 相 同 ， 只 需要 在 调用 


距离 向 Nr 


压缩 。 由 于 FFT 逆 


cufftExecC2C 函数 中 改 


3.2 国定 相位 补偿 


图 3 距离 向 点 乘 示 意 


对 


钟 何平 ， 


子 阵 2 


子 阵 3 


图 4 


子 阵 1 本 本 国 国 | 加 


r 折 国 加 加 四 


aXiv 合 作 


Chi 
, 


距离 向 Nr 


固定 相位 补偿 示意 图 


ty, 


国 国 回国 


固定 相位 补 


在 进行 


脉冲 原始 数据 为 1 个 2 维 
线程 按照 距离 向 i 


式 。1 维 
其 包含 的 线程 
(BN+1) *TN-1 距离 向 
程 按照 先 子 阵 、 后 脉冲 
位 补偿 。 为 节 和 


数据 的 固定 相位 补偿 


涯 时 ， 将 原始 数据 看 做 3 维 
数组 ， 不 同 脉冲 原始 数 ] 
行 分 块 , 假设 当前 线程 块 索引 为 BN， 
个 数 为 TN， 则 该 线程 块 完成 列 数 为 BN*TN 到 
。 线程 块 中 每 一 线 


式 ， 每 个 
居 看 做 层 闭 
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项 序 完成 同一 距离 向 上 所 有 数据 固定 相 


i 计算 量 ， 充 分 考虑 固定 相位 补偿 


和 距离 确定 情况 下 ， 补 
1 个 子 阵 所 有 


永 冲 数据 进行 补偿 ， 


从 因子 为 常数 ， 因 此 补偿 1 


据 进 行 补偿 ， 从 而 可 有 效 避 免 元 余 计 算 。 


3.3 ”方位 向 脉冲 压缩 


方位 向 脉冲 压缩 是 在 距离 时 域 方位 频 
。 方 位 向 脉冲 压 


距离 向 徙 动 校正 


ht 
村 点 ， 


在 子 阵 


然后 依次 对 后 续 每 


页 序 上 先 对 第 
个 子 阵 数 


或 进行 的 ， 其 核心 是 


缩 流 程 如 图 


相位 补偿 后 ， 
FFT 函数 变换 条 件 ， 


需要 对 数据 进行 转 置 


5 所 示 ， 完 成 固定 
需要 在 方位 向 上 进行 FFT 变换 。 为 满足 CUDA 中 
操作 ， 使 得 数据 在 内 


存 中 连续 。 从 流程 图 中 可 以 看 出 ， 在 进行 FFT 变换 和 IFFT 变 


固定 相位 补偿 是 完成 将 原始 多 子 阵 回 波形 式 变 为 单子 阵 回 。” 换 前 后 分 别 需要 进行 1 次 矩阵 转 置 操作 。 和 矩阵 转 置 过 程 需要 使 
波形 式 ， 然 后 调用 单子 阵 回 波 算法 进行 成 像 处 理 。 合 成 孔径 声 。 用 共享 存储 器 ， 采 用 合并 读 写 方式 来 提高 转 置 速度 
纳 成 像 的 关键 就 在 于 固定 相位 补偿 的 精度 ， 不 同学 者 对 不 同 环 
人 、 二 矩阵 转 置 方位 向 参考 函数 
境 下 的 具体 补偿 方法 进行 了 深入 研究 。 通 常 相位 补偿 精度 与 计 J 
算 量 乘 正比 ， 在 考虑 非 停 走 停 情 形 下 的 固定 相位 补偿 公式 为 FFT 变 换 Co 

: y 
h 
ep | 区 站 ] | . 本 ， 四 
其 中 /为 中 心 频 率 ，Ah 为 第 i 个 接收 子 阵 与 发 射 阵 方位 向 等 | I 
效 相 位 中 心间 隔 ，c 为 声速 ，v 为 载体 运动 速度 ，y 为 斜 距 。 从 用 高 同和 到 性 秆 阵 转 置 
补偿 公式 可 以 看 出 ， 及 (Ah,n) 的 取 值 仅 与 接收 子 阵 的 位 置 和 狸 
图 5 方位 向 脉冲 压缩 流程 图 


距 有 关 ， 不 同 脉冲 之 间 的 补偿 过 程 是 完全 相同 


且 独 立 的 。 根 


据 固定 相位 补偿 特点 ， 这 里 仍然 采用 1 维 线程 块 进行 固定 相位 


补偿 ， 有 具体 方法 


如 图 


4 所 示 。 


将 数据 变 为 距离 时 域 方位 频率 后 ， 根 据 距 离 徙 动 公式 


AR(f.,7)=(f./f,) r12 


(4) 
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计算 出 对 应 徙 动量 , 其 中 /为 斜 距 ，/ 为 方位 频率 ，f, 为 


最 大 方位 频率 。 从 徙 动 公式 可 看 出 徙 动量 是 一 个 二 元 函数 ， 它 


与 斜 距 和 方位 频率 有 关 。 在 进行 距离 徙 动 校正 时 ， 不 同方 位 频 


率 上 数据 校正 过 程 是 完全 独立 的 ， 这 里 采用 1 维 线程 ， 每 一 线 


程 块 完成 当前 距离 向 上 所 有 方位 频率 数据 距离 徙 动 校 正 。 


于 


同一 方位 频率 数据 在 距离 徙 动 校正 中 ， 相 邻 线程 插值 所 需 数据 


存在 重复 ， 


将 校正 过 程 中 所 需要 的 数据 先 


为 减 小 数据 访问 延迟 ， 在 进行 校正 前 ， 当 前 线程 块 
< 同 载 入 到 共享 存储 器 ， 校 正 过 


程 中 直接 使 用 
维 线程 块 中 线程 ;所 对 应 的 空间 距离 徙 动量 为 (f/ 六 )r/12, 则 


< 享 存储 器 中 数据 。 假设 插值 点 数 为 2N ,当前 1 


其 对 应 的 距离 向 徙 动 单元 数 AN = floor((f.1 f,)AR/(2R,))， 


其 插值 所 | 


原始 数据 下 标 在 i+ AN, 一 N 和 i+AN, +N 之 间 。 完 
成 距离 向 徙 动 校正 后 ， 


然后 与 方位 向 参考 函数 


态 ,(f,)=exp(xf”/k) 相 乘 ， 其 中 f 表示 多 普 勒 频率 ，k 为 多 


普 勒 调频 斜率 ， 并 且 


IFFT 变换 ， 
4 ”实验 


为 验 订 


为 斜 距 > 函数。 最 后 再 一 次 进行 方位 向 
完成 方位 向 脉冲 压缩 ， 获 得 最 终 成 像 结果 。 


结果 
E 异 构 环 境 下 的 合成 孔径 成 像 算法 效率 ， 本 文 在 如 下 


环境 下 进 
CPUG@2.80 
4G， 操 作 


行 了 测试 处 理 器 Intel(R) Core(TM) i5-4200H 
GHZ4 核 ， 显卡 NVIDIA GeForce GTX 950M， 内 存 
系统 Windows 7 旗舰 版 ， 软 件 环 境 开 发 环境 : 


VS2008+CUDA5.0。 为 测试 算法 效率 , 本文 比较 了 CPU 串 行 计 


基于 OpenMP 的 共享 内 存 并 行 计算 方法 和 CPU+GPU 


的 异 构 并 行 计算 方法 效率 。 成 像 过 程 中 ， 距 离 徙 动 校正 插值 点 


数 设 


为 6。 异 构 并 行 算法 中 ，1 维 线程 块 大 小 设置 为 。 

实验 过 程 中 采用 了 一 组 真实 数据 ， 该 数据 是 2010 年 7 月 
在 某 内 陆 湖 进 行 干 
体 实验 参数 如 表 1 所 示 。 实 测 数据 所 对 应 的 原始 


涉 合成 孔径 声 纳 海 试 样机 实验 中 获得 的 ， 具 


波幅 度 信 息 


I 


如 图 


起 始 距离 和 结 


6(a) 所 示 ， 距 离 向 点 数 为 9600, 方位 向 点 数 为 3456， 采集 


距离 分 别 为 5lm 和 231m， 在 距离 向 上 回 波 


钟 何平 ， 等 : 异 构 环境 下 的 多 子 阵 合成 孔径 声 纳 


参数 数值 参数 数值 
载 频 (kHz) 150 ”脉冲 重复 时 间 (ms) 320 
带宽 (kHz) ”20 子 阵 长 度 (m) 0.08 
脉 宽 (ms) ”20 子 阵 个 数 48 
声速 (m/s) ”1448 ”载体 速度 (m/s) 2.5 


be 
(=】 


方位 向 ( 米 ) 
加 


100 


120 
距离 向 


(a) 原 始 


140 


I 


波 


160 180 


( 米 ) 


类 
有 
R 
60 80 100 120 140 160 180 200 220 
距离 向 ( 米 ) 
(b) 合 成 孔径 成 像 结果 


图 6 实测 数据 成 像 实验 


为 充分 体现 异 构 环境 下 的 距离 多 普 勒 成 像 算法 效率 优势 ， 


将 其 与 串 行 计算 方法 和 
体 结果 如 表 2 所 示 。 


k 享 内 存 


行 计 算 方 法 
合成 孔径 成 像 预 处 理 步 又 主要 完成 原始 数 


进行 了 比较 ， 具 


据 截 取 、 数 据 类 型 转换 和 子 阵 数据 于 


加 处 理 ， 由 于 这 一 部 分 计 


算 量 小 ， 在 比较 合成 孔径 成 像 算法 效率 时 可 忽 
CPU 串 行 计 算 进 行 合成 孔径 成 像 所 需 时 间 最 长 


中 可 看 出 , 采 


多 不 计 。 从 表 2 


为 14 653ms， 采 用 OpenMP 方式 进行 共享 内 存 方法 并 行 后 ， 各 


部 分 计算 时 间 均 显著 降低 ， 总 计算 时 


间 降 为 5 706ms， 加 速 比 


达到 2.58。 采 用 


GPU 进行 计算 时 ， 


于 采用 了 CUDA 中 高 效 


度 一 致 性 较 好 。 原 始 区 
计 72 个 脉冲 数据 组 成 , 数据 采集 总 时 间 为 23.04s 。 


波 方 位 向 上 数据 由 4 个 合成 孔径 长 度 共 
于 相 邻 原 


始 数据 块 在 方位 向 上 存在 1 个 合成 孔径 长 度 的 重 登 ， 因 此 实际 


可 上 


于 信号 处 理 
结果 是 相同 的 ， 均 如 医 


于 三 种 成 像 方法 的 计算 
清晰 重 构 出 了 成 


的 时 间 仅 为 17.28s。 
6(b) 所 示 ， 成 像 结果 


像 场 景 轮 廓 信息 ， 验 证 了 距离 多 普 勒 成 像 算法 的 有 效 性 。 


FFT 变换 函数 库 ， 距 离 向 脉冲 压缩 、 方 位 向 FFT 和 方位 向 脉冲 


压缩 计算 效率 都 得 到 了 显著 提高 ， 


分 别 由 3736、2783 和 3 895 


GPU 


ms 下 降 为 82、109 和 143 ms。 采 用 


进行 合成 孔径 声 纳 成 


像 计算 时 ， 虽 然 增加 了 显存 分 配 、 数 据 上 传 和 数据 下 载 时 间 ， 
但 总 计算 时 间 大 幅度 下 降 ， 只 需 1 013 ms， 加 速 比 高 达 14.45， 


满足 实时 成 像 需求 。 


表 2 不 同 计算 方法 效率 比较 (ms) 
成 像 、 oe se 显存 ”数据 ”数据 
距离 向 脉冲 压缩 ”固定 相位 补偿 ”方位 向 FFT ”距离 徙 动 校正 ”方位 向 脉冲 压缩 总 时 间 ”加 速 比 
方法 分 配 上传 ”下载 
方法 1 3736 152 2783 4087 3895 0 0 0 14653 1 
方法 2 1562 54 1079 1664 1347 0 0 0 5706 2.58 
方法 3 82 17 109 483 143 38 71 70 1013 14.45 


方法 1: CPU 串 行 计算 方法 ， 方 法 2: 基 了 


F OpenMP 的 共享 内 存 并 行 计 


方法 ， 方 法 3: CPU+GPU 的 


构 


F 行 计算 方法 。 
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